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高 校 图 书馆 读者 数据 的 监管 与 增值 利用 
以 2017 年 北京 大 学 阅读 报告 为 例 


目 吴 亚 平 “” 别 立 谦 ” 周 春霞 赵 飞 汪 聪 
北京 大 学 图 书馆 ”北京 100871 


摘要 : [目的 /意义 ] 提 出 读者 数据 利用 框架 ,以 有 助 于 引导 图 书馆 更 规范 地 对 读者 数据 进行 系统 的 收集 、 
整理 保存 和 挖掘 ,实现 其 增值 利用 。[ 方法/ 过程 ] 引 入 数据 监管 和 基于 数据 生命 周期 的 数据 服务 拓展 理念 ， 
立 基 于 生命 周期 的 读者 数据 监管 框架 ,并 基于 此 框架 ,以 《2017 年 北京 大 学 阅读 报告 ) 为 例 , 分 析 如 何 面向 图 书 
馆 和 读者 进行 读者 数据 监管 。[ 结果 /结论 ] 读 者 数据 监管 一 方面 可 以 帮助 图 书馆 明确 读者 来 访 及 借 书 规律 、 核 
心 读者 群体 资源 利用 情况 ,合理 优化 各 类 资源 和 服务 ; 另 一 方面 通过 向 读者 推荐 阅读 资源 和 服务 ,帮助 读者 提 
高 自身 阅读 质量 ,使 其 充分 地 利用 图 书馆 ,从 而 为 读者 数据 监管 和 增值 利用 的 规范 化 \ 深 入 化 发 展 提供 有 益 参 
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图 书馆 业务 的 开展 和 读者 天 然 紧 密 地 联系 在 一 
元 ;小 者 的 需求 和 喜好 是 图 书馆 优化 的 方向 和 动力 。 
大 数据 专家 徐 子 沛 在 《 数 文明 》 新 书 发 布 会 上 提 到 , 数 
据 正 在 引领 人 类 高 清晰 社会 , 重 塑 文明 ""。 可 以 理解 
为 数据 可 以 让 我 们 更 了 解 社 会 。 同 样 ,在 图 书馆 界 , 数 
据 世 将 帮助 我 们 更 清晰 地 看 到 读者 的 需求 和 图 书馆 的 
资源 .服务 效用 。 大 数据 的 环境 下 ,图 书馆 对 读者 数据 
价值 的 重视 提升 到 了 新 高 度 。 国 际 图 联 趋 势 报告 中 明 
确 提出 ,图 书馆 员 需 要 对 版 权 .数据 保护 和 隐私 的 含义 
有 更 好 、 更 广泛 的 理解 ”。 图 书馆 已 逐步 开设 了 数据 
馆 员 岗 位 ,目前 其 岗位 名 称 有 数据 馆 员 、 数 据 服务 馆 
员 ,数据 可 视 化 分 析 馆 员 数据 管理 馆 员 ,数据 存储 馆 
员 与 研究 数据 专家 等 中 。 基 于 读者 特征 数据 和 行为 数 
据 的 创新 应 用 已 经 渗透 到 多 种 服务 中 ,如 基于 对 读者 
借 书 .翻阅 报刊 .浏览 电子 资源 等 行为 数据 的 分 析 ,为 
资源 建设 .资源 布局 .空间 优化 等 提供 决策 支持 。 近 些 
年 ,在 智慧 图 书馆 个 性 化 图 书馆 的 发 展 理念 下 ,图 书 
馆 更 注重 读者 数据 的 分 析 和 展示 ,除了 日 常 的 挖掘 与 


利用 外 ,更 是 推出 阅读 报告 .大 数据 报告 .个 人 阅读 账 
单 .实时 数据 展示 屏 等 多 种 形式 的 数据 阅读 服务 ,这 些 
都 是 读者 数据 监管 和 增值 利用 的 实践 。 笔 者 在 相应 工 
作 的 基础 上 提出 读者 数据 监管 框架 ,以 期 推动 读者 数 
据 被 更 规范 、 更 深入 地 增值 利用 。 


2 相关 研究 


2.1 数据 监管 是 实现 数据 增值 的 重要 途径 ,图 书馆 应 
担当 好 “监管 人 ”角色 

“curation ”一 词 最 早 应 用 于 西方 文艺 遗产 保护 方 
面 ,博物 馆 学 中 称 之 为 “ 策 展 ", 即 策划 、 科 选 并 展示 ， 
“curator” 指 对 脆弱 而 又 贵重 的 博物 保存 和 展览 活动 进 
行 构思 组织 .管理 的 人 员 “"。 在 Science 研究 环境 
下 ,“Digital Curation” 于 2001 年 被 首次 提出 ,英国 数据 
策 展 中 心 (Digital Curation Center,DCC ) 将 其 定义 为 对 
数据 进行 整个 生命 周期 的 管理 .维护 .保存 ,以 实现 数 
据 增 值 的 所 有 活动 ”。2002 年 ,微软 首席 研究 员 、 计 
算 机 图 灵 奖 获得 者 J，Gray 提出 “data curation”, 并 指 
出 短暂 数据 具有 不 可 替代 ,不 可 重建 的 特性 ,是 必须 要 
保存 的 ,比如 每 一 天 的 气温 , 若 不 记录 保存 , 则 无 法 复 
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。 国 内 学 者 通常 将 其 翻译 为 数据 策 管 数据 监护 、 
数据 监管 数字 保护 和 数据 掌管 等 ,来 表达 其 在 对 数据 
进行 选择 组织、 存储 的 基础 上 实现 数据 复 用 、 增 值 的 
含义 ,从 而 维持 数据 的 可 生存 能 力 、 可 呈现 能 力 和 可 理 
解 能 力 " 1。 此 处 的 数据 包括 数字 资产 ,数字 数据 .数字 
科研 数据 原始 资料 数据 集 等 所 。 本 文 借鉴 最 常见 的 
3 种 译 法 之 一 ,将 其 翻译 为 “数据 监管 "。 读 者 数据 作 
为 短暂 数据 的 一 种 ,对 图 书馆 资源 和 服务 的 优化 有 重 
要 作用 ,必须 及 时 地 保存 ,管理 并 加 以 增值 利用 。 

数据 增值 是 对 专门 学 科 领 域 的 数据 进行 广泛 的 收 
集 , 之 后 对 数据 进行 验证 和 关联 ,通过 可 视 化 技术 展示 
关联 结果 ,从 而 在 保护 数据 的 同时 实现 数据 增值 ” 
数据 监管 的 过 程 包含 了 数据 增值 的 关键 步骤 ,是 数据 
增值 的 重要 途径 。 图 书馆 作为 信息 资源 的 拥有 者 和 提 
供 客 ,除了 收集 、 整 理 和 挖 气 信 息 , 更 要 将 所 得 信息 产 
上 用户 避 民 定 的 主题 思路 ,艺术 性 地 展现 在 
和 前" ,担当 好 “监管 人 ”的 角色 。 在 图 书馆 逐步 
光大 数据 交谈 服务 中 ,也 要 求 数据 具有 较 弄 的 科 
党 性 ,实时 可 用 性 ,生命 周期 活动 可 控 性 和 数据 管理 动 
< 本 维护 性 ,数据 监管 正 是 读者 阅读 服务 质量 ( quality 
Estrvice ,QOS ) 的 重要 保障 ” 。 

2 基于 读者 数据 的 阅读 服务 和 数据 决策 更 日 常 化 ， 
群 总 也 更 加 细 分 

.全 年 度 阅读 报告 、 个 人 阅读 账单 .阅读 清单 、. 实 时 数 
护 攻 示 屏 等 都 是 读者 数据 监管 的 体现 。 年 度 阅读 数据 
报 央 到 源 成 熟 , 彼 至 2018 年 1 月 26 日 ,已 有 过 括 百 所 图 
书馆 发 布 了 2017 年 阅读 数据 报告 。 从 视角 的 不 
同 (于 以 分 为 综合 性 阅读 报告 和 个 性 化 阅读 报告 ,综合 
性 阅读 报告 以 图 书馆 为 中 心 ,整体 性 ,群体 性 强 , 可 对 
资源 利用 和 读者 阅读 情况 形成 全 局 的 认识 ;个 性 化 的 
阅读 报告 以 读者 为 中 心 ,描述 读者 个 性 化 的 阅读 行为 ， 
有 更 强 的 读者 存在 感 和 参与 感 。 除 年 终 统计 外 ,读者 
数据 报告 也 体现 出 常态 化 .精细 化 的 特点 ,如 沈阳 师范 
大 学 图 书馆 "发布 暑 假 阅读 数据 .黑龙江 大 学 图 书 
馆 259 发 布 寒假 阅读 数据 ,沈阳 师范 大 学 图 书馆 还 推送 
月 度 的 热门 外 借 书 单 " ,众多 图 书馆 甚至 推出 实时 数 
据 展示 大 屏 。 分 析 的 群体 从 整个 读者 群体 细 化 到 了 新 
生 , 毕 业 生 ,校友 等 ,如 北京 大 学 图 书馆 面向 新 生 推 出 
“新 生 特辑 1 当 萌 新 遇见 图 书馆 ” ,面向 毕业 生 推出 
“ 书 ， 时 光 ” 毕 业 纪念 卡 套装 ,支持 在 线 生 成 和 分 享 电 
子 版 阅读 纪念 卡 "" ;厦门 大 学 图 书馆 面向 毕业 生 推 出 
的 “图 : 时 光 : 给 毕业 生 的 一 份 礼物 ”" ;四 川 大 学 图 
书馆 面向 校友 推出 的 “毕业 生 的 不 二 情书 “一 封 家 
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书 "” “等 ,这 些 个 性 化 的 阅读 数据 展示 ,记录 了 读者 
的 阅读 足迹 , 极 具 收 藏 价值 , 深 受 读者 欢迎 。 随 着 数字 
媒体 显示 技术 的 进步 及 液晶 屏 、LED 屏 等 显示 设备 的 
发 展 ,实时 数据 显示 屏 成 为 了 图 书馆 宣传 服务 的 新 方 
式 。 如 上 海 图 书馆 利用 可 视 化 技术 和 多 媒体 展现 技 
术 , 直 观 、 实 时 地 展示 业务 统计 数据 , 既 可 以 为 图 书馆 
决策 提供 支持 ,又 是 一 种 大 数据 应 用 的 阅读 推广 方 
式 ”。 还 有 学 者 提出 ,未 来 甚至 可 以 专门 设置 读者 个 
性 化 区 域 ,基于 读者 的 借阅 历史 建立 个 性 化 知识 模型 ， 
读者 刷卡 后 即 可 显示 可 能 感 兴趣 的 图 书 及 其 基本 信 
息 .在 架 情 况 等 ” 。 大 数据 阅读 服务 作为 一 种 新 的 服 
务 形式 ,是 读者 数据 监管 的 表现 形式 , 即 基 于 一 个 既定 
目标 ,搜集 处 理 数 据 , 挖 掘 数 据 内 涵 , 并 借助 数据 可 视 
化 技术 艺术 性 地 展示 出 来 ,从 而 指导 图 书馆 更 好 地 优 
化 资源 和 服务 ,指导 读者 更 好 地 提升 自 吴 阅读 质量 。 
2.3 数据 可 视 化 技术 日 渐 成 熟 ,在 数据 监管 中 举 足 轻 
重 


数据 可 视 化 是 数据 监管 的 关键 步骤 ,如 今 人 们 已 
oo 
效 的 信息 呈现 方式 。 人 类 80% 以 上 的 信息 通过 视 
i 
获取 的 信息 。 数 据 可 视 化 提供 了 易于 阅读 与 优美 的 视 
觉 体 验 ,更 高 效 地 传达 了 数据 内 涵 , 如 今 已 应 用 到 了 多 
个 领域 。 包 括 位 置 .形状 方向、 颜色、 纹理 、 灰 度 等 级 、 
尺寸 等 在 内 的 可 视 化 变量 也 在 不 断 扩展 '"。 作 为 一 
种 高 效 的 信息 展示 形式 ,可 视 化 技术 的 应 用 渗透 到 了 
图 书馆 的 多 个 业务 场景 :在 馆藏 资源 引导 方面 ,以 直 
观 的 图 形 或 图 像 的 方式 展示 图 书馆 的 资源 布局 情况 ， 
多 用 于 新 生 引导 和 日 常 引导 ;@ 在 资源 揭示 方面 ,提取 
资源 的 属性 特征 ,作为 揭示 内 容 的 维度 ,如 世界 数字 图 
书馆 以 时 间 轴 和 地 图 的 可 视 化 形式 向 读者 展示 世界 各 
地 文化 的 原始 资料 ,促进 了 国际 文化 的 交流 ; @ 在 
资源 检索 方面 ,实现 了 馆藏 资源 关联 表示 可 视 化 .馆藏 
资源 查询 过 程 可 视 化 .馆藏 资源 检索 结果 可 视 化 
3;@ 在 业务 统计 方面 ,可 视 化 的 展示 有 助 于 更 高 
的 管理 决策 ,如 厦门 图 书馆 业务 数据 可 视 化 平台 集 
展示 读者 信息 和 馆藏 使 用 情况 ,为 图 书馆 文献 采购 、 
字 化 馆藏 建设 .馆藏 剔 旧 等 决策 提供 了 科学 依 
2 。 此 外 还 有 基于 Timeline 的 图 书馆 大 事 记 可 视 
5、 引文 分 析 吕 等 方面 。 如 今 , 图 书馆 更 加 看 重 数 
据 可 视 化 ,并 设置 相关 的 岗位 提供 更 专业 的 服务 。 如 
杜 克 大 学 ,加州 大 学 伯克利 分 校 .哈佛 大 学 均 设 置 了 数 
据 可 视 化 分 析 馆 员 , 要 求 具备 数据 提取 ,清理 转换、 分 
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等 . 高 校 图 书馆 读者 数据 的 监管 与 增值 利用 


以 2017 年 北京 Pe nay 疾 


少 人 人 帮 甘 日 
EA 


用 所 


析 技 术 ,掌握 数据 可 视 化 技术 等 能 力 ” 。 

综合 各 种 数据 可 视 化 技术 ,可 将 其 分 为 面向 低 维 
度数 据 的 柱状 图 、 折 线 图 、 饼 图 等 标准 2D/3D 技术 ,以 
及 适用 于 多 维度 、 大 数据 集 的 几何 投影 技术 、 基 于 图 像 
技术 、 面 向 像素 的 技术 、 分 层 技术 等 新 技术 ” 。 数 据 
可 视 化 工具 也 发 展 迅 速 ,包括 :excel 等 入 门 级 工具 ;EE- 
Charts .D3.js 等 开源 工具 ;R、Gephi 等 专业 工具 ;Tab- 
leau 等 商业 工具 ;等 等 。 随 着 不 断 升级 发 展 ,可 视 化 工 
有 具 具有 更 强 的 易 操 作 性 、 实 时 性 动态 性 和 丰富 的 展现 
形式 \ 支 持 多 类 型 数据 格式 等 特点 。 可 视 化 技术 可 以 
更 直观 ,快捷 准确 地 捕捉 数据 内 涵 , 在 读者 数据 的 监 
管 中 将 起 到 关键 作用 。 


3 ”基于 征 
及 实践 

数据 监管 包含 对 数据 进行 整个 生命 周期 的 管理 、 
维护 .保存 ,以 实现 数据 增值 的 所 有 活动 。 数 据 生命 周 
和 从 数据 产生 加工 .发 布 到 再 利用 的 个 循环 过 
种 > 基于 数据 生命 证 周期 的 数据 服务 拓展 可 划分 为 数据 
估 工 数据 再 加 工 ,知识 抽取 三 类 ” 。 笔 者 结合 数 
握 蜂 管内 涵 及 基于 数据 生命 周期 的 数据 服务 拓展 , 提 
册 富 全 三 个 阶段 八大 模块 的 图 书馆 读者 数据 监管 杠 


加 


3, 亿 数据 初 加 工 阶段 
数据 初 加 工 阶段 是 数据 增值 的 基础 和 保障 ,其 内 
容 林 框架 如 图 1 所 示 : 


命 周期 的 读者 数据 监 


各 


读者 群体 数据 ”|e| 主 页 访问 记录 : 电子 资源 访问 记录 等 


ee 读者 身份 特征 〈 姓 各、 性别、 院 系 等 ) 

读者 个 性 化 数据 |*| 读 者 行为 数据 ( 到 馆 、 借 书 、 预 约 图 书记 录 等 ) 
书目 数据 。 上-e| 书 名、 作者 、 馆 址 等 OPAC 数据 

读者 一 卡通 数据 |-* | 包含 读者 身份 特征 、 姓 名 、 性 别 、 院 系 等 : 


创建 新 的 特征 维度 


图 1 数据 初 加 工 阶段 的 监管 框架 


数据 采集 阶段 目的 是 全 面 地 搜集 读者 数据 。 读 者 
数据 包括 4 个 方面 :中 电子 资源 访问 等 读者 群体 数据 ， 
有 助 于 从 整体 角度 ,客观 地 体现 发 展 趋势 .发现 热 门 资 
源 ;@) 借 书记 录 等 含有 读者 ID 的 个 性 化 数据 ,是 开展 


特征 创建 ”上 *| 面向 新 的 分 析 目 标 ， 新 的 特征 维 : 


个 性 化 数据 服务 产品 的 基 丰 


出 ;(3)OPAC 系统 中 的 书目 


数据 ,更 详细 地 描述 图 书 特征 ,是 对 读者 行为 数据 中 


数据 中 读者 身份 信息 的 重要 
完成 数据 采集 后 的 数据 


ei 


书 属性 的 重要 扩展 ;由 读者 一 


用 的 重要 前 提 , 主要 包括 4 个 部 分 :中 数据 清洗 ,表现 
在 通过 第 三 方 数 据 源 对 缺失 数据 进行 填补 ,如 通过 学 
校 一 卡通 数据 对 借 书 记录 里 读者 院 系 是 
的 记录 进行 匹配 补缺 ,最 大 程度 消除 信息 不 确定 性 ， 
以 及 对 无 关 数 据 进 行 删除 ,如 删除 借 书记 录 中 夹杂 的 


卡通 数据 ,是 对 读者 行为 
扩展 。 
预 处 理 模 块 是 数据 增值 利 


“部 门 未 知 ” 


装订 记录 ;@ 数 据 规范 ,对 同 


进行 统一 ,如 将 同一 院 系 的 全 称 和 简称 统一 


一 属性 值 的 不 同 表现 形式 
为 全 称 ;@) 


数据 规约 , 即 对 宛 余 的 属性 进行 删除 ,如 读者 院 系 编号 


和 院 系 名 称 ,只 
根据 分 析 目 标 创建 新 的 特 和 


保留 院 系 名 称 字 有 段 即 可 ;(@ 特 


征 创建 ， 


部 字段 ,从 而 探讨 不 同学 
储 则 贯穿 始终 , 既 要 存储 原 娄 
和 结果 数据 。 

3.2 数据 再 加 工 阶 段 


F ,如 基于 院 系 字 段 创建 学 


部 的 读者 借 书 特征 。 数 据 存 


台数 据 ,也 要 存储 处 理 过 程 


数据 再 加 工 阶 段 是 数据 增值 的 重要 体现 ,内 容 和 


框架 见 图 2。 


基于 数据 初 加 工 阶段 得 到 的 规范 的 异 构 、 多 源 数 


据 , 首 先 要 建立 数据 连接 , 增 
个 方面 :一 方面 是 基于 读者 


加 数据 关联 。 主 要 包括 两 
ID 整合 读者 一 卡通 数据 、 


借 书 记录 、 进 馆 记 录 、 预 约 记录 、 续 借 记 录 等 读者 行为 
数据 ,从 而 拓展 读者 特征 ,全 面 地 还 原 读者 在 图 书馆 的 


行为 ; 男 一 方面 是 


据 中 的 图 书 特征 。 


数 | 统计 分 析 , 得 出 发 


是 基于 图 书 IDD 整合 读者 行 


为 数据 与 OPAC 书目 数据 ,拓展 读者 行为 数 


在 建立 多 维 数据 连接 后 ， 


可 从 时 间 ,资源 类 型 等 分 析 维 度 进 行 一 般 性 


展 趋 势 ,发掘 热门 作者 及 


在 资源 等 ,也 可 进行 


四 利 月 


价值 和 知识 。 


多 属性 间 的 交叉 分 析 , 分 


析 得 出 男女 最 喜爱 的 作者 ,不 同学 部 读者 
日 资源 的 差异 等 。 数 据 分 析 与 可 视 化 展 
示 相 辅 相 成 ,数据 分 析 赋 予 可 视 化 展示 价 
值 与 意义 ,可 视 化 
在 利用 数据 可 视 化 的 手段 


展示 帮助 从 数据 中 提取 


时 ,首先 要 明确 可 视 化 的 原则 和 希望 展现 


的 目标 ,并 基于 此 选择 合 
和 工具 ,使 最 终 的 效果 具有 “ 


晰 、 组 合 维度 、 对 比 恰 当 , 动 


适 的 可 视 化 方法 
油墨 比 " 高 效 、 视 角 清 
态 可 交互 等 特征 ,从 而 充 


分 利用 人 类 的 视觉 带宽 ,提升 用 户 对 数据 的 思考 能 


力 和 理解 效率 。 
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Es EL 
中 国 国 
加 [本 可 司 
和 国 辐 要 | 
| 本 | 


要 | | 
国王 拓展 读者 特征 和 行为 本 拓展 图 书 属性 
加 EN 
本 数据 单 属性 的 一 般 分 析 多 属性 的 交叉 分 析 
| I 
各 | | 可视化 的 原则 与 目 可 视 化 的 方法 和 工具 
可 视 化 于 a 


3.3 知识 抽取 阶段 
知识 抽取 阶段 是 数据 增值 的 最 高 等 级 ,内 容 和 框 
架 如 图 3 所 示 : 


拓展 读者 特征 和 行为 |----- 拓展 图 书 特征 上 ----- 


关联 分 析 | 聚 类 分 析 

社会 网 络 分 析 | 推荐 系统 
CN 口 I 给 力 D 
加 图 图 3 知 详 4 抽取 阶段 的 监 管 框架 


二 知识 抽取 是 知识 服务 的 前 提 , 大 数据 环境 下 的 知 
识 鼎 务 须 同步 爆发 式 数据 增长 与 社会 化 趋势 , 将 视角 
ea re no sa 

和 网 实时 数据 、 非 结构 化 数据 及 机 器 数据 ,调用 内 部 、 
外 部 以 及 公共 信息 ,从 而 做 出 前 瞻 性 的 数据 判断 5 。 
读者 数据 监管 更 要 利用 好 图 书馆 内 部 、 校 内 其 他 部 门 
和 网 络 公开 数据 。 除 自身 数据 外 ,一 方面 要 整合 校内 
课程 成 绩 、 科 研 成 果 等 读者 数据 ,挖掘 更 多 数据 关联 ， 
例如 美国 大 学 与 研究 图 书馆 协会 发 布 报告 表明 ,使 用 
图 书馆 服务 ( 借阅 .数据库 访问 、 馆 际 互 借 等 ) 多 的 学 
生 往往 取得 了 更 高 水 平 的 学 业 成 功 ( 如 课程 成 绩 .GPA 
等 ) ” ; 另 一 方面 要 多 渠道 获取 书目 数据 来 拓展 图 书 
特征 ,书目 数据 相当 于 一 本 书 的 名 片 ,是 用 户 了 解 书籍 
的 窗口 ,单一 的 书目 数据 源 不 足以 多 方位 描述 一 本 书 
的 特征 ,Web2.0 的 资源 共享 理念 带 来 了 越 来 越 多 的 网 
络 资源 ,Amazon 等 图 书 电 商 网 站 和 豆瓣 等 书评 社区 中 
所 包含 的 评分 .标签 .评论 等 读者 行为 数据 是 对 图 书馆 
OPAC 书目 数据 的 重要 补充 。 

通过 数据 融合 得 到 读者 大 数据 集 是 知识 抽取 的 基 
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础 ,数据 挖 据 技术 是 知识 抽取 的 重要 手段 。 目 前 数据 
挖掘 技术 主要 应 用 于 读者 分 析 研 究 、 资 源 建 设 优化 、 管 
能 化 服务 、 信 息 自 动 化 处 理 \ 个 性 化 服务 等 多 方面 ”。 
读者 数据 监管 服务 需要 更 深层 次 地 挖掘 数据 内 涵 , 通 
过 关联 挖掘 ,得 到 阅读 兴趣 相似 的 读者 以 及 内 容 相似 
的 资源 ;通过 聚 类 分 析 , 针 对 更 具体 的 读者 和 资源 群 
体 ,开展 精细 化 服务 ;通过 社会 网 络 分 析 , 找 到 关键 的 
读者 和 资源 ,以 最 优 宣传 策略 达到 阅读 推广 的 目标 ; 通 
过 推荐 系统 ,实现 精准 的 个 性 化 阅读 推荐 等 。 


4 读者 数据 监管 结果 与 展示 
《2016 年 北京 大 学 阅读 报告 》” 是 北京 大 学 图 书 


馆 首 次 推出 的 年 度 阅 读 报告 ,对 阅读 资源 和 服务 进行 
了 系统 的 梳理 ,对 读者 利用 图 书馆 的 特征 进行 了 分 析 、 
展示 。《2017 年 北京 大 学 阅读 报告 )”” 在 其 基础 上 进 
行 了 内 容 和 形式 的 优化 ,提升 了 规范 性 .全面 性 .美观 
性 ,是 读者 数据 监管 与 增值 利用 的 重要 成 果 。 在 第 3 
节 监 管 框架 和 流程 的 基础 上 ,《2017 年 北京 大 学 阅读 
报告 > 主要 从 面向 图 书馆 优化 服务 和 面向 读者 优化 阅 
读 两 方面 进行 监管 。 
4.1 面向 图 书馆 优化 服务 的 监管 
面向 图 书馆 优化 服务 的 监管 ,以 明确 读者 来 访 及 

借 书 规律 核心 读者 群体 资源 利用 情况 为 目标 ,从 而 
帮助 图 书馆 合理 优化 各 类 资源 和 服务 。 
4.1.1 从 读者 来 访 看 ”读者 来 访 不 再 限于 实体 到 馆 ， 
主页 访问 、 微 信 关 注 等 来 访 渠 道 都 起 到 了 重要 作用 。 
12:00 -12:59 是 读者 平均 到 馆 人 次 最 高 的 时 段 ,不 同 
时 期 的 日 均 到 馆 人 次 有 差异 ,考试 周 实地 到 馆 人 次 明 
显 增加 ,而 假期 到 馆 人 次 明显 减少 ( 见 图 4) ,图 书馆 可 
基于 读者 密度 ,更 科学 地 调配 人 力 等 资源 ,调整 服务 。 
微 信 公众 号 中 的 馆藏 检索 栏目 点 击 次 数 和 点 击 人 数 均 
为 最 多 ,可 见 微 信 公 众 号 不 仅 是 宣传 的 利器 ,其 功能 

同样 受 欢 迎 ,是 资源 发 现 的 重要 入 口 之 一 。 


+2225 


全 年 日 均 到 馆 4072 人 次 


+566 


[a 暑假 寒假 


春季 学 期 考试 周 秋季 学 期 考试 周 


-3 263 


—3 458 


图 4 2017 年 读者 不 同时 期 日 均 到 馆 人 次 差异 


吴 亚 平 ， 别 立 谦 , 周 春 霞 ， 等. 高 校 图 书馆 读者 数据 的 监管 与 增值 利用 


报 工作 ,2019 ,63(18 ) :63 - 69. 


凡 2017 车 汪 京 大 学 风 由 RY 全 入 


4.1.2 从 资源 利用 情况 看 ”数据库 、 多 媒体 等 电子 资 
源 以 及 资源 发 现 系统 、 自 助 服务 等 更 便捷 的 资源 搜索 、 
获取 方式 越 来 越 受 欢迎 。2013 - 2017 年 , “未 名 学 术 
搜索 ”电子 资源 全 文 下 载 篇 次 多 媒体 资源 在 线 检索 
与 点 播 频次 均 持续 上 升 ,电子 资源 和 相关 服务 越 来 越 
重要 。 阅 读 设备 更 新 换代 较 快 ,Kindle 系列 的 阅读 器 
目前 最 迎合 读者 需求 ,在 资源 预约 榜 中 遥遥 领先 。 同 
时 ,自助 服务 也 担当 了 重要 角色 ,如 自助 借 书 册 次 占 
50.34% ,超过 了 人 工 借 书 。 分 馆 在 文献 保障 体系 中 起 
到 了 重要 作用 ,面向 全 校 读 者 开放 的 服务 的 分 馆 数量 
不 断 增 加 。2017 年 分 馆 图 书 外 借 量 总 计 达 8 万 余 册 
次 , 信 ， 息 科 学 技术 学 院 分 馆 的 外 院 系 读者 外 借 量 占 比 
排名 第 一 , 达 50% 。 针 对 不 同文 献 采取 的 不 同 馆藏 方 
戏 与 读者 借 书 实际 情况 相符 ,体现 出 合理 性 ,可 以 看 出 
借 书 的 比例 高 于 闭 架 借 书 .储存 馆 借 书 、 馆 际 互 借 
让 起 ( 见 图 5) ,2017 年 读者 通过 闭 架 借 书 和 储存 馆 借 
人 年 ,这 是 由 于 2017 年 图 书馆 为 
东 馆 改造 工程 进行 了 资源 的 重新 布局 ,开架 空间 
受到 压缩 ,数据 也 反映 出 了 闭 架 e 借 书 .储存 馆 借 书馆 
际 台 借方 式 借 书 量 的 增加 。 
Rp 


于 闭 架 借 书 三 储存 馆 借 书 馆 际 互 借 


1.22% 1.15% 


20 


36.81% 


60.81% 


chinaXiv 


图 5 2016( 内 环 )/2017 (外 环 ) 年 读者 
不 同方 式 借 书 量 占 比 


4.1.3 从 读者 特征 与 阅读 习惯 看 “人 文学 部 、 社 会 科 

学 学 部 的 读者 是 使 用 图 书馆 空间 和 实体 资源 较 多 的 读 
者 群体 ;人 文学 科 类 图 书 的 跨 学 科 渗 透 率 更 强 , 在 各 

学 部 读者 的 借 书 所 属 学 科 占 比 中 都 占据 了 较 大 的 比 
重 。 在 到 馆 方 面 ,人 文学 部 和 社会 科学 学 部 的 读者 
分 别 占 到 馆 读 者 的 30% 和 21% ,二 者 共 占 据 了 半壁 
江山 ;在 借 书 方面 ,二 者 之 和 达到 了 66% (其 中 人 文 
学 部 44% ,社会 科学 学 部 22% ) 。 外 国语 学 院 的 到 
馆 总 人 次 和 借 书 总 册 次 最 多 ,马克 思 主 义学 院 的 人 
均 借 书 量 和 有 借 书 行为 的 读者 占 比 最 高 。 读 者 的 跨 
学 科 阅 读 趋 势 十 分 明显 ( 见 图 6) ,可 以 看 出 每 个 学 部 
的 读者 在 阅读 本 学 科 的 图 书 外 ,对 其 他 多 个 学 科 都 


有 涉猎 。 

信 息 
| 跨 学 “理学 经 济 与 与 工程 
读者 所 属 学 部 人 文学 部 社会 科学 学 部 ” 科 类 。” 部 管理 学 部 科学 部 

\ / 
# A 有 
- 
~” # x 
A : 
Wa 
| , 
了 | As 天 | 地 re 
辐 书 所 属 学 科 人 文学 科 社会 科学 。 管理 学 


图 6 2017 年 读者 所 属 学 部 与 图 书 学 科 类 别 匹 配 度 情况 


4.2 面向 读者 优化 阅读 的 监管 

面向 读者 优化 阅读 的 监管 ,以 向 读者 推荐 阅读 资 
源 和 服务 为 目标 ,从 而 帮助 读者 提高 自身 阅读 质量 ,更 
加 充分 地 利用 图 书馆 。 首 先 向 读者 整体 介绍 图 书馆 的 
资源 服务 与 开放 时 间 ; 其 次 展示 热门 外 借 的 中 外 文 图 
书 、 热 门 预约 图 书 、 热 门 电子 书 、 热 门 教 参 书 等 热门 资 
源 , 男 / 女 读者 最 喜爱 的 作者 ( 见 图 7) 等 ,向 读者 推荐 
热门 资源 ;最 后 以 时 间 轴 的 形式 展示 2017 年 的 阅读 活 
动 ,包括 人 文 讲座 .电影 讲座 北京 大 学 首届 阅读 马 拉 
松 活动 “ 书 声 过 递 ” 世 界 读书 日 系列 活动 、 文 化 工作 
坊 活动 ,吸引 读者 回 看 讲座 视频 ,并 关注 来 年 的 系列 活 


动 , 激 发 了 读者 的 学 习 兴 趣 , 也 对 阅读 资源 进行 了 推 
广 。 
4 交 
韦伯 1 
条 E = 
py 金庸 
3 关东 千 走 本 六 上 
全 _ 二 可 铂 
和 5 人 
语 读 椒 于 
权 拉 便 康德 僵 书 : ~ EE” 
李 甘 于 胡适 rn 


7 2017 年 最 受 男 / 女 读 者 喜爱 的 前 50 位 作者 排名 


对 读者 数据 的 监管 与 增值 利用 的 实践 主要 集中 在 
数据 初 加 工 和 数据 再 加 工 阶段 。 通 过 面向 图 书馆 优化 
服务 和 面向 读者 优化 阅读 两 方面 的 监管 ,一 方面 有 助 
于 图 书馆 对 资源 和 服务 进行 全 景 扫描 ,为 图 书馆 资源 
建设 .服务 布局 人 员 调 配 等 方面 提供 决策 支持 ; 另 一 
方面 有 助 于 读者 全 面 认识 图 书馆 的 资源 和 服务 ,并 发 
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掘 优质、 热门 资源 ,从 而 提升 自身 阅读 质量 。 不 足 之 处 
是 知识 抽取 阶段 的 实践 仍然 较 少 ,实时 的 数据 驱动 精 
细 的 服务 划分 .个 性 化 的 推送 将 是 阅读 报告 未 来 优化 
和 应 用 的 方向 。 


5 结语 


现代 信息 技术 从 本 世纪 初 开始 推动 着 图 书馆 向 知 
慧 图 书馆 方向 演进 与 发 展 ,人 工 智 能 时 代 的 到 来 ,也 必 
将 驱使 当前 智慧 图 书馆 的 服务 满足 社会 服务 需求 , 具 
有 智能 特征 ,进而 向 智能 图 书馆 方向 发 展 ” 。 读 者 数 
据 监 管 与 增值 利用 ,是 大 数据 环境 下 增强 图 书馆 智能 
特征 的 重要 手段 。 笔 者 基于 阅读 报告 的 实践 ,初步 建 
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Reader Data Curation and Value-added in University Libraries : 
A Case Study of the 2017 Peking University Reading Report 
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Abstract: [ Purpose/significance | The paper put forward the reader data utilization framework to guide the library 
tostematically collect organize, save and mine reader data more systematically and realize its value -added utilization. 


[id process | The paper introduced data curation and data lifecycle based data service development concepts ，and 


证 a lifecycle -based reader data curation framework. Based on this framework, the paper took the practice of the 2017 
Peking University Reading Report as an example curating for libraries and readers. [ Result/conclusion | Through the 


caration of reader data, on the one hand, it helps the library to clarify the readers ”access and borrowing rules, core read- 


er Febups, resource utilization ，and rationally optimize various resources and services. On the other hand, by recommen- 
di 全 reading resources and services to readers, readers can improve their reading quality and make full use of libraries. It 
pravides a useful reference for the standardized and in -depth development of reader data curation and value-added utiliza- 
tioga 
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